Aggregation Functions (SUM, AVG, COUNT, etc.)

Big Data and Analytics - অ্যাপাচি ইমপালা (Apache Impala) - Impala এর জন্য Data Aggregation এবং Window Functions

187

Apache Impala তে Aggregation Functions ব্যবহার করা হয় ডেটার ওপর বিভিন্ন গণনা বা সারাংশ তৈরি করতে। এই ফাংশনগুলো ডেটাসেটের একটি বা একাধিক কলামের ওপর কাজ করে এবং সাধারণত একটি আউটপুট রিটার্ন করে, যা সাধারণত সংখ্যাসূচক মান হয়। Aggregation Functions মূলত ডেটা বিশ্লেষণের জন্য ব্যবহৃত হয়, যেমন মোট যোগফল, গড়, গণনা ইত্যাদি।

এখানে Impala তে ব্যবহৃত কিছু গুরুত্বপূর্ণ Aggregation Functions আলোচনা করা হলো।

১. SUM()

SUM() ফাংশনটি একটি নির্দিষ্ট কলামের সব মানের যোগফল বের করে। এটি সাধারণত সংখ্যাসূচক ডেটার জন্য ব্যবহৃত হয়।

উদাহরণ:

SELECT SUM(sales_amount) AS total_sales
FROM sales;

এটি sales টেবিলের sales_amount কলামের সব মান যোগফল করবে এবং total_sales নামক আউটপুট রিটার্ন করবে।

২. AVG()

AVG() ফাংশনটি একটি নির্দিষ্ট কলামের গড় মান বের করে। এটি সাধারণত সংখ্যাসূচক ডেটা যেমন বয়স, মূল্য, পরিমাণ ইত্যাদি গণনা করতে ব্যবহৃত হয়।

উদাহরণ:

SELECT AVG(age) AS average_age
FROM employees;

এটি employees টেবিলের age কলামের গড় বয়স বের করবে এবং average_age আউটপুট রিটার্ন করবে।

৩. COUNT()

COUNT() ফাংশনটি একটি কলামের (বা সব রেকর্ডের) সংখ্যার হিসাব করে। এটি সাধারণত ডেটাসেটে কয়টি রেকর্ড বা নির্দিষ্ট মান আছে তা জানার জন্য ব্যবহৃত হয়।

উদাহরণ:

SELECT COUNT(*) AS total_employees
FROM employees;

এটি employees টেবিলের মোট রেকর্ড বা কর্মচারীর সংখ্যা বের করবে।

একটি নির্দিষ্ট কলামের মান গোনা:

SELECT COUNT(department_id) AS department_count
FROM employees;

এটি department_id কলামের মোট রেকর্ডের সংখ্যা বের করবে।

৪. MIN()

MIN() ফাংশনটি একটি কলামের সর্বনিম্ন মান বের করে। এটি সাধারণত সর্বনিম্ন মূল্য, পরিমাণ বা অন্য যে কোনো সংখ্যাসূচক মান বের করতে ব্যবহৃত হয়।

উদাহরণ:

SELECT MIN(salary) AS lowest_salary
FROM employees;

এটি employees টেবিলের salary কলামের সর্বনিম্ন বেতন বের করবে এবং lowest_salary আউটপুট হিসেবে দেখাবে।

৫. MAX()

MAX() ফাংশনটি একটি কলামের সর্বোচ্চ মান বের করে। এটি সাধারণত সর্বোচ্চ মূল্য, পরিমাণ বা অন্য কোনো সংখ্যাসূচক মান বের করতে ব্যবহৃত হয়।

উদাহরণ:

SELECT MAX(salary) AS highest_salary
FROM employees;

এটি employees টেবিলের salary কলামের সর্বোচ্চ বেতন বের করবে এবং highest_salary আউটপুট হিসেবে দেখাবে।

৬. GROUP_CONCAT()

GROUP_CONCAT() ফাংশনটি একটি কলামের মানগুলোকে একত্রিত করে একটি স্ট্রিং আকারে রিটার্ন করে। এটি বিশেষভাবে ব্যবহার করা হয় যখন একাধিক মান একত্রে দেখানোর প্রয়োজন হয়।

উদাহরণ:

SELECT department_id, GROUP_CONCAT(employee_name) AS employee_names
FROM employees
GROUP BY department_id;

এটি employees টেবিলের employee_name গুলোর একটি স্ট্রিং তৈরি করবে, যা department_id এর ভিত্তিতে গ্রুপ করা হবে।

৭. STDDEV()

STDDEV() ফাংশনটি একটি কলামের স্ট্যান্ডার্ড ডেভিয়েশন বের করে, যা ডেটার বৈচিত্র্য বা ছড়িয়ে পড়া পরিমাপ করে।

উদাহরণ:

SELECT STDDEV(salary) AS salary_deviation
FROM employees;

এটি employees টেবিলের salary কলামের স্ট্যান্ডার্ড ডেভিয়েশন বের করবে।

৮. VARIANCE()

VARIANCE() ফাংশনটি একটি কলামের ভ্যারিয়েন্স বের করে, যা ডেটার ছড়িয়ে পড়া বা বৈচিত্র্য পরিমাপ করে। এটি স্ট্যান্ডার্ড ডেভিয়েশনের বর্গফল।

উদাহরণ:

SELECT VARIANCE(salary) AS salary_variance
FROM employees;

এটি employees টেবিলের salary কলামের ভ্যারিয়েন্স বের করবে।

৯. COUNT(DISTINCT)

COUNT(DISTINCT) ফাংশনটি একটি কলামের ইউনিক বা আলাদা মানের সংখ্যা বের করে। এটি ডুপ্লিকেট মান বাদ দিয়ে আলাদা মান গণনা করতে ব্যবহৃত হয়।

উদাহরণ:

SELECT COUNT(DISTINCT department_id) AS unique_departments
FROM employees;

এটি employees টেবিলের department_id কলামের ইউনিক বা আলাদা department_id গুলি গণনা করবে।

সারাংশ

Impala তে Aggregation Functions বিভিন্ন ধরনের পরিসংখ্যান বের করতে ব্যবহৃত হয়, যেমন মোট যোগফল (SUM), গড় (AVG), মোট গণনা (COUNT), সর্বনিম্ন মান (MIN), সর্বোচ্চ মান (MAX), এবং আরও অনেক কিছু। এই ফাংশনগুলো ডেটা বিশ্লেষণে অত্যন্ত গুরুত্বপূর্ণ এবং ডেটাবেসের বিভিন্ন কলামের ওপর সারাংশ বা সামগ্রিক পরিসংখ্যান তৈরি করতে সহায়ক। GROUP BY ক্লজ ব্যবহার করে বিভিন্ন গ্রুপে ডেটা বিভক্ত করে এই ফাংশনগুলো প্রয়োগ করা যায়, যা আরও গভীর বিশ্লেষণ করতে সাহায্য করে।

Content added By

Rezwan Siddiki Tamim

GROUP BY এবং HAVING Clause এর ব্যবহার Window Functions এবং তাদের ব্যবহার CUME_DIST, NTILE, LAG, LEAD Functions

Aggregation Functions (SUM, AVG, COUNT, etc.)

১. SUM()

২. AVG()

৩. COUNT()

৪. MIN()

৫. MAX()

৬. GROUP_CONCAT()

৭. STDDEV()

৮. VARIANCE()

৯. COUNT(DISTINCT)

সারাংশ

Promotion

Satt AI

Hi, আমি SATT AI!

Aggregation Functions (SUM, AVG, COUNT, etc.)

১. SUM()

২. AVG()

৩. COUNT()

৪. MIN()

৫. MAX()

৬. GROUP_CONCAT()

৭. STDDEV()

৮. VARIANCE()

৯. COUNT(DISTINCT)

সারাংশ

All Notifications

Promotion

Satt AI

Hi, আমি SATT AI!